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STATISTIQUE INFERENTIELLE 

Module Methodes Quantitatives : 
-Statistique III 
(S4) 

Section D 


• On inverse les conclusions de I'etape 
precedente pour en deduire la structure 
vraisemblable de la population dont est 
issu I'echantillon observe; c'est la phase 
inferentielle (3® me chapitre) 


INTRODUCTION GENERALE 

• II y a en statistique deux approches : 

• La Description (roe en S2) : consists a issum er 
et& decrte un ensem bie de donnees. 

• L’inference statistique : son but est d’etendre 
les proprietes de I’echantillon a la population 
entiere (objet de ce semestre) et de valider ou 
de rejeter des hypotheses a priori ou formulees 
apres une etape descriptive (objet de S5). 


On remarque que cette demarche est 
semblable a la demarche scientifique 
habituelle 


Observer 



La demarche statistique est la suivante 


• L'echantillon est tire au hasard dans une 
population plus vaste (l er chapitre). 

• Le calcul des probabilites (vu en S3) permet 
ensuite de preciser les caracteristiques de 
I'ensemble des echantillons que I'on aurait 
pu obtenir par le meme procede; c'est 
I'etude des distributions d'echantillonnage 
(2eme chapitre) 
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-Les methodes statistiques sont 
aujourd'hui utilisees dans presque 
tous les domaines de I'activite 
humaine : economie, gestion, 
industrie, medecine, sciences 
humaines... 
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CHAPITRE 1 


ECHANTILLONNAGE 


Introduction 

L'enquete statistique est I'operation 
technique qui consiste a elaborer 
les statistiques. Elle a pour but de 
determiner un ensemble de 
caracteristiques d'une population. 
On distingue deux types 
d'enquetes: 

Le recensement et Ce sondaae 


I- RECENSEMENTS ET SONDAGES 
• 1- Definitions 

- Definition! : La population est un ensemble 
de personnes ou d'objets sur lesquelles 
porte une etude. Et on appelle individu 
chaque element de cette population. 

- Definition2 : On appelle recensement ou 
(enquete exhaustive) I'observation de la 
population entiere. 
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- Remarque : Selon I'ONU: «le recensement de 
I'habitat est une operation qui permet de 
recueillir, grouper, evaluer, analyser et publier les 
donnees demographiques, economiques et 
sociales se rapportant a un moment donne a tous 
les habitants d'un pays » 

- Definition3 : On appelle ecHantiCCon, une partie 
representative de la population observee. 

- Remarque : La population d'ou on tire 
I'echantillon s'appelle « population mere » 


3- Types d'erreurs: 

On distingue deux types d'erreurs: 

a) - Erreur de mesure (e m ): elle provient des 
imprecisions du questionnaire, des erreurs 
professionnelles des enqueteurs... 

b) - Erreur d'echantillonnage ou erreur aleatoire (e a ): 
elle tient au fait qu'on n'observe qu'une partie de la 
population. 


Definitions On appelle enquete par sondage, 
I'observation d'une partie representative de la 
population mere, dans le but d'etudier un ensemble 
donnee de caracteristiques de cette derniere. 
Definirion5: On appelle taux de sondage, le rapport 
de la taille d'echantillon a la taille de la population 
mere: 


echantillon 

-population 




2- Les avantages des enquetes par sondage 

Les sondage s presentent de nombreux 
avantages par rapport aux recensements . Leurs 
cout est nettement moins eleve. De plus, ils sont 
plus rapides. Seul le recensement exprime un 
resultat certain puisqu'il n'ya plus, en theorie, de 
probleme d'inference statistique (probleme 
d'estimation). 

Cependant, I'experience montre que les 
sondages sont souvent tres precis. 


Remarque: Dans un recensement, I'erreur aleatoire 
disparaTt mais I'erreur de mesure persiste, et elle est 
souvent beaucoup plus importante que dans un 
sondage; car on doit employer un grand nombre 
d'enqueteurs hativement formes. II n'y a done 
aucune raison que I'erreur totale soit plus grande 
dans le cas d'un sondage. 

Un sondage bien fait peut-etre plus precis qu'un 
recensement tout en coutant beaucoup moins cher. 


3 









D.TOUIAR 


04/03/2008 


* Le principal inconvenient des sondages est 
de presenter des erreurs 
cTechantillonnage, qu'on tente de reduire 
en utilisant des methodes rigoureuses de 
construction d'echantillons. 


A- Echantillonnage Aleatoire 

•1- Echantillonnage aleatoire simple: 

-La construction d'un echantillon aleatoire simple 
de taille n est realisee par un tirage au hasard avec 
remise de n individus dans I'ensemble de la 
population. Ainsi, tous les individus seront tires de 
maniere independante et auront une chance egale 
de faire partie de I'echantillon. 

•Pour constituer un tel echantillon, on fait souvent 
appel aux « Tables des nombres aleatoires». 


Quelques methodes de prelevement d'un 
echantillon 

•On distingue deux types de sondages 

- Les sondages aleatoires: qui aboutissent a la 
construction d'echantillons aleatoires. 

- Les sondages par choix raisonne generent des 
echantillons empiriques. Cette deuxieme 
methode ne sera pas etudiee en ce semestre. 


B-Le tirage d'echantillon aleatoire 
simple 

1- Les tirages avec et sans remise 

-L'echantillonnage aleatoire simple (EAS) est base sur 
un tirage avec remise. Si on constitue un tel echantillon, 
chaque individu aura une probability 1/N d'etre le 
premier element de I'echantillon. Pour le deuxieme 
element, chaque individu aura toujours la meme 
probability 1/N; ainsi de suite, a chaque tirage, on aura 
la probability 1/N 



• Par contre s'il n'y avait pas de remise: 

• Au premier tirage, la probability est 1/N 

• Au deuxieme, la probability est 1/(N-1) 

• Au n® me , la probability est l/(N-n+l) 

— Dans le cas d'un tirage sans remise on ne peut 
obtenir d'echantillon de taille superieure a N de la 
population; on I'appelle done: tirage exhaustif 
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□ Lorsque la taille de la population est 
importante par rapport a la taille de 
I'echantillon, on confond alors le tirage 
sans remise et le tirage avec remise 


A priori, la loi et en particulier /iet o 2 
sont inconnus. 

-On tire au hasard 9 families avec 
remise, et on observe la realisation de 
la variable X pour les families tirees. Ce 
qui revient a observer les realisations 
de 9 V.A. independantes et de meme 
lo[. 


II- ECHANTILLONNAGE 


Le but de ce paragraphe est 
d'etudier les liens theoriques 
existant entre la population et 
I'echantillon aleatoire preleve 
dans cette population. 


Definition : Les n V.A. X X - - , X- 

constituent un echantillon aleatoire 
simple de la V.A. X si et seulement si 
X J , X 2 , • ■ • ,X n sont independantes et 
de meme loi que X. 

• Desormais, on appellera X la VA parente. 

• Remarque: 

e{x i )=e{x 2 )=-- = e(x ii )=e(x)=m 

V(X I )=V(X 2 )=- = V(X n )=V(x)=<r 2 


1-L'Echantillonnage aleatoire simple 

• -On realise une etude demographique sur 
la fecondite chez la femme citadine. Pour 
ce, on considere la variable aleatoire X 
qui designe /e nombre d’enfants pa r 
famille. 

• Soit^la loi de X. L'esperance //et la 
variance o 2 sont deux parametres de 
cette loi. 

• On note alors X ^ o 2 ) 

• Avec //=E(X) et c^=V(X) 


• 2- La moyenne d’echantillonnage 

II s'agit toujours de I'etude concernant la 
fecondite chez la femme citadine. On 
s'interesse au nombre moyen d'enfants 
par famille. Pour cela, on preleve 5 
echantillons aleatoires et on observe la 
realisation des 9 V.A X 1 ,X 2 ,--- ,X 9 
pour chacun des 5 echantillons: 
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Echantillon 

1 

2 

3 

4 

5 

Xx 

2 

1 

4 

4 

0 

X 2 

1 

0 

3 

4 

1 

x 3 

1 

0 

3 

0 

0 

x 4 

1 

4 

0 

1 

2 

x 5 

3 

3 

1 

0 

2 

x 6 

2 

2 

2 

3 

2 

x 7 

5 

5 

5 

2 

4 

X 8 

2 

1 

2 

4 

3 

x 9 

4 

0 

2 

1 

5 

X 

2,3 

1,8 

2,4 

2,1 

2,1 


• Quelques exemples de statistiques: 

- 1 ^ X.+ — + X 

X = — > X . = — moyenne echantillon 

n i=l n 

5 2 = — V (x ; - X ) ; variance echantillon 

S 2 = — — V (x ; . - X ) 2 ; quasi - variance 
n- l~t 


• On remarque que le nombre moyen 
d'enfants par famille x prend des 
valeurs differentes selon I'echantillon 
considere; ou : 

9tr 1 9 

• X est done une variable aleatoire; 
e'est done une statistiaue. 


I- Proprietes de la statistique X 

• Le tableau precedent nous a permis 
d'obtenir 5 realisations de la 
moyenne d'echantillonnage qu'on 
note 

X i , ^2 > ' ’ ’ ? -^g 

On s'attend a ce que ces 5 valeurs 
soient proches de la moyenne p. 


Definition : Soit X lf X 2 , X n un 
echantillon aleatoire simple de taille 
n, et h une fonction de R n ->R ; 
la variable aleatoire 

Y=h(X 1 , X 2 , X n ) 

est appelee une statistique. 


1- Calcul de e(x) 

• A) Propriete 1: 

Soit X u X 2 , X n un echantillon 
aleatoire simple de taille n, relatif a la 
V.A. parente X. L'esperance de la V.A. 

X est egale a la moyenne de la 
population p : 

e(V) = E(X)=n 
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2-Calcul de y(x) 

• Propriete 2 : 

Soit X l7 X 2 , X n un echantillon 
aleatoire simple de taille n, relatif a la 
V.A^ parente X. La variance de la V.A. 

X est egale a la variance de X divisee 
par la taille isi t d J fe,'I / 4chantilllon : 

\^x)S^L 

n n_ 


• Remarque : limv(x) = 0 


• Exemple 

• Soit 2^(2) la V.A. parente : 

E(X)= 1=2 = V(X) 

D'ou: 

E(x)=2 et V(x)=2/n 


C- La variance d'echantillonnage et la 
quasi-variance 

•On note S 2 la variance d'echantillonnage: 

sl=-±{x,-x) 

n Tt 

•On rappelle que S e 2 est une statistique: 
c'est une V.A. qui associe une valeur 
numerique a chaque tirage d'echantillon. 


I- Proprietes de la statistique S ^ 

1- Calcul de E(S e 2 ) 

• Propriete 3: Soit X lf X 2 , X n un— 
echantillon aleatoire simple de taille n, 
relatif a la V.A. parente X de moyenne 
jiet de variance a 2, Alors, I'esperance 
de Sg est egale a: 



Remarque: 

>L'esperance de la variance 
d'echantillonnage n'est pas une image 
parfaite de la variance a 2 . 

Efc)*<7 2 

>Pour remedier a cet inconvenient, on 
construit une statistique qui 
approchera le mieuxa 2 


Propriete 4 : Soit x l7 X 2 , X n un 

echantillon aleatoire simple de taille n, 
relatif a la V.A. parente X de moyenne 
jj. et de variance a 2 - Alors, I'esperance de 
la quasi-variance est egale a la variance 
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Remarque 

On peut montrer egalement que les 
variances de S 2 et de S 2 tendent 
toutes les deux vers zero lorsque la 
taille de I'echantillon tend vers 
I'infini : 


limv(s 2 ) = limv(s 2 ) = 0 


D- Notion de Frequence 

Lors d'une production industrielle 
des pieces mecaniques, on 
s'interesse a la proportion des 
pieces defectueuses. Si on note X 
la V.A. qui prend, avec une 
probability p, la valeur 1 si la piece 
est defectueuse et qui prend 0, 
avec la probability 1-p sinon. on 
note alors : 


On extrait de cette production un E.A. de 
taille n. Soit Xi, X 2 , x n cet echantillon 
aleatoire. Alors chaque X; suit une loi de 
Bernoulli de parametre p 

X, 

De plus les X, sont independantes, par 
consequent, leur somme S n suit une loi 
binomiale : 

S n 3! (n,p) 


• S„ represente le nombre de pieces 
defectueuses dans I'echantillon : 

P{S lt =k)=^p k q'- k -,k=0X..,n 

• Definissons la frequence /comme etant 
la proportion de pieces defectueuses 
dans I'echantillon : 

^ s n x l + x 2 +---x n 

f = — !L — I A «_ 

n n 




• Si xest une valeur numerique que peut 
prendre la statistique F, alors : 

X |l avec laproba./? si piece defectueuse 


xe\o, A 
{ n n n J 

1 0 avec proba. 1 - p si piece conforme 


• D'ou : 


• Et la distribution de Fe st donnee par : 

X ~^(p) 


j{ F=x ) = f{s= n ^=c n x p nx F nx 
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♦ Remarque :Les proprietes de F sont 
deduites de celles de X (puisque F est un 
cas particulier de X ) 


•Propriete 6 : Soit la V.A. parente X qui suit 
une loi de Bernoulli de parametre p. Les 
moments de la statistique j^sont comme 
suit : 


E{f)=p et V(F) = m 
n ■ 


E- Theoremes 
fondamentaux de la 
Statistique 

I- Convergence en probability 


Definition : La suite aleatoire X u X 2 , 
X n ,... converge en probabilite vers 
la V.A. X, appelee limite de la suite, 
si : 



• Ce que Ton note: 




• Remarque : 

«lOn peut redefinir la convergence en 
probabilite comme suit : 

\/£ > 0; limP|X n -X|>f}=0 

«SLa V.A. X peut etre une constante ; par 
exemple, lorsqu'on etudie la 
convergence d'une suite de 
statistiques vers la valeur vraie d'un 
parametre 


II- Convergence en LOI 

• Definition : La suite aleatoire Xi, X 2 , 

X n ,... converge en loi vers la V.A. X, 
appelee limite de la suite si 

\imF n (x) = F(x) \ 

en tout point de continuity xde F(x) 

• Et on note : 

X n~ L ^ X 

• Ou F(x)o . st la fonction de repartition de X 


Convergence de la loi de Poisson vers la 
loi Normale 

• Propriete 10 : Soit une V.A. Znormale 
centree reduite: ^(0,1) et soit 

une suite de V.A. X v X 2 , X n ,... telles 

que: X n ^(,K) avec limJi n =+oo 
Alors; 1 

I x,-\ L ~ 

4k 
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Remarque: 



• Si X est suffisamment grand {A 

>15), 


Convergence de la loi de Khi- 

Alors : 



deux vers la loi Normale 





Rappel sur la loi de Khi- 


^(X) = U,a) 



deux: / 2 


^ 





Convergence de la loi Binomiale vers la loi 
Normale 

Propriete 11 : Soit une V.A. Z normale 
centree reduite: et soit 

une suite de V.A. X lt X 2 , ..., X n ,... telles 
que: X n (j\ , p) 



Definition : Soit une suite de n V.A. Z lf 
Z 2 , ..., Z n independantes et de meme loi 
normale centree reduite : Z i ^,jZ\ 0,1) 

On appelle loi de Khi-deux a n degres 
de liberte, la loi suivie par la somme des 
carres des V.A. Zp on note : 



Remarque : 

• si n > 30 et np > 5 et nq > 5 

Alors : 


&(n,p) xs^r{np,npq) 

Z 


b)- Distribution cTune Khi-deux 

• La distribution de% 2 est dissymetrique. 
Elle est continue et elle depend du 
nombre de degres de liberte n. Pour des 
valeurs differentes de n, on obtient des 
distributions differentes. Lorsque n 
augmente, la loi de % 2 tend lentement 
vers la loi normale 
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Convergence de la loi de 
Student vers la loi Normale 

Rappel sur les lois de Student : 
t et de Fisher : F 




• Definition LSoient X une V.A. de khi-deux 

d)- Une propriety de Khi-deux 


a n d.d.l. et Y une V.A. de khi-deux a m 
d.d.l. avec X et Y independantes; on 
definit alors la V.A. de Fisher par le 

• La somme de deux Khi-deux independantes de 
d.d.l. respectifs n et m est une Khi-deux de d.d.l. 
n+m ; on note : 


rapport des rapports des deux V.A. de 
khi-deux par leurs d.d.l. respectifs n et m 
et on note : 




WV) 

et ouX\lY => X+Y^r^{n+m) 


y 

• et ouXUY => yT^ 

Y^rM 


/ m 
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• (n, mjest la notation de la loi de 

Fisher a (n,m) d.d.l. Sa densite etant 
dissymetrique, etalee a droite. 


• Propriete 14: moments de la loi de Fisher 


Soit (n,m ); alors 

( E ( F ) = n /m- 2 si m>2 ] 



2m 2 (n + m-2) 
n(m - 2) 2 (m- 4) 



Distribution de la loi de Student 


• Les distributions de Student sont 
continues et symetriques et dependent 
d'un parametre n. A des valeurs 
differentes de n, correspond differentes 
distributions de Student. Lorsque /7tend 
vers I'infini, la loi de student tend vers la 
loi normale. 


• Remarque : 

>Si est le fractile d'ordre p de la 
V.A. de Fisher a (n,m) d.d.l, alors : 



>Cette loi joue un grand role en 
statistique (loi du rapport des 
variances de deux echantillons 
independants) 



Definition : Soit Z une V.A. suivant la loi 
normale centree reduite : 0,1) 

et soit X une V.A. de Khi-deux a vdegres de 
liberte: X ^ J 2 (v) et independante de Z . On 
definit alors la V.A. T suivant la loi de student a 
vdegres de liberte, notee/ v : 
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Proprietes de Student 

S Soit T ^ t (n //alors si n >120 


T ~ ^(o,i) 


Loi des Grands Nombres 
(loi faible) 


Theoreme 1: Loi des grands nombres 
Soit X lf X 2 , X n un echantillon aleatoire 
simple de taille n, relatif a la V.A. parente 
X de moyenne jj,/ alors : 



Remarque: Ce resultat reste vrai quelque 
soit la loi de X. done en particulier pour la 
loi de Bernoulli 


Corollaire 1: Soit la V.A. parente X 
suivant une loi de Bernoulli de parametre 
p/ alors : 



Remarque: Cela veut dire que la 
frequence d'un evenement converge vers 
sa probability 

La demonstration du Theoremel decoule 
du lemme suivant 


Lemme : Inegalite de Bienayme-Tchebicheff 

Si e designe un reel strictement positif, et 
X une V.A. d'ecart type a, alors 

v £ ) 

• Indication pour demonstration : 

• voir dans le cas d'une v.a. discrete et 
poser 9 

Y = (X - EX f et calculer EY 


• Remarque: 

• La loi des grands nombres peut etre 
generalisee: 

• Theoreme 2: Soit T=T(X U X 2/ X n ) une 
statistique telle que : 

lim E(T) = 0 et UmV(r) = 0 
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Cas des echantillons Aleatoires issus d'une 
population Normale 

• Lorsque I'E.A. est relatif a une loi 
normale, on obtient des proprietes plus 
interessantes pour les statistiques X et 
S 2 


- Propriete 16: Soi alors 


X , o 2 / n) 


Theoreme CENTRAL LIMITE 
(T.C.L.) 

• Theoreme 3: (T.C.L. formulation) 

• Soit X lr X 2 , ..., X n un echantillon aleatoire 
simple de taille n, relatif a la V.A. parente 
X de moyenne pet de variance a 2 - Alors, 

X -ju I X - n L 

• — = vn — — ^^T(0,1) 

_o_ a 

yfn 


• Remarque: Le T.C.L. s'applique a 
toute V.A. quelque soit sa loi; il 
fournit une propriete asymptotique. 

• Alors que la propriete 16 ne 
s'applique qu'aux V.A. suivants une loi 
Normale et quelque soit la taille de 
rechantillon. 


• Theoreme 4: (T.C.L. formulation) 

■ Pour une taille n assez grande (en 
pratique(^>30}) on a: 

• rXTr(u. c7 !/) 


• Corollaire2: Soit la V.A. parente X suivant 
une loi de Bernoulli de parametre p/Si 


alors on a 


n > 30 et np > 5 et nq > 5 


F^\pM 


Propriete 17: Sous I'hypothese de normalite. 



Propriete 18: Sous I'hypothese de normalite : 


4n 


X-fi 
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Remarque: Sous I'hypothese de 
normalite, et si la moyenne de la 
population est connue , on a: 

\ 

n ~ 2 

— -S 2 ^ r 2 ?”) 

<7 


Oil S 2 


1 

n 




Lorsque le tirage est sans remise, toutes 
les proprietes qu'on a enonce (ou 
presque), concernant les statistiques , 
X,F,S e etS ne sont plus valables. En 
effet, on peut montrer qu'on a : 


f e(x) = n 
\v(x) = 

E{f) = p'' n N \ 

V(F) = 2±N^n 
n N -1 


Remarque : Cas des petits 
echantillons 


• Lorsque n est petit, on ne peut 
utiliser le T.C.L. et par consequent on 
ne peut obtenir une loi pourx. Or si 
on ajoute rhvpothese de normalite . 
on obtient des resultats importants 
quelque soit n. 



Remarque: Si n est negligeable devant 
N (la taille de la population finie), le 
tirage sans remise devient equivalent a 
un tirage avec remise. Dans la pratique, 
ceci prend effet lorsque: , T v __ 

N > 20 n 


F- Cas des echantillons 
exhaustifs 
(T.S.R.) 


L' Estimation 
Chapitre II 
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INTRODUCTION 

Apres avoir preleve I'echantillon, et etudie les 
distributions d'echantillonnage, on peut alors 
generalise^ a la population, les resultats 
experimentaux obtenus a partir de 
I'echantillon; c'est ce qu'on appelle I'inference 
statistique. 


A- L' ESTIMATION PONCTUELLE 
• l- Definitions 

-Definition!.: Soit X lf X 2 , X n un E.A.S 
relatif a la V.A. parente X de loi Jzf(0). 

On appelle estimateur du 
parametre 0toute statistique utilisee 
dans le but d'approcher la valeur 
inconnue de 0. Un estimateur est done 
une Variable Aleatoire. 


x L'estimation consiste en revaluation 


- Definition2: Une estimation du 

d'un parametre de la population a 


parametre 0est une realisation d'un 

partir de I'observation d'un E.A. 


estimateur de ce parametre. Une 

x La theorie de l'estimation se divise en 


estimation est done une valeur 

deux parties: 


numerique. 

- Exemples: 

1) L ’estimation ponctuel/e\ permet 


Si X^,^ 7 (|^) — -estimateurx estimation x 

d'obtenir une valeur unique calculee a 


partir d'un E.A., valeur qui sera prise 
comme estimation du parametre 


Si X^,^ 7 (p) — .estimateur/7 estimation / 

inconnu. 


|Se \ S e 

„ , „ i — ^estimations^ 



Si X^.^(a 2 ) ^estimateur L 2 1 2 


2) L ’estimation par intervaffe '. permet de 
determiner un intervalle qui, avec une 
grande probabilite fixee a priori, 
contient la valeur vraie du parametre 
inconnu. 

• Exemp/e: On dit que 53% de la 
population favorise le candidat A avec 
une marge d'erreur de 1% et avec un 
niveau de confiance de 95%. Ce qui 
signifie que la proportion d'electeurs 
favorisant A se situe, avec une 
probabilite de 95%, entre 52% et 54%. 


• M- Proprietes des estimateurs 

• l-Estimateurs sans biais 

•Definition: On appelle estimateur 
sans biais du parametre 0toute statistique 
T=T(X lf X 2 , X n ) telle que: 


E(T) = d 
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Remarque 1: Si Test biaise, le biais 
serai alors: 

B=E(T)-e 



E(T)=e 6 E(T) 


- Exemp/es: 

| X est un estimateur sans biais de jU 
5 2 est un estimateur sans biais de a 2 
S 2 est un estimateur biaise de a 2 

b(s 2 c ) = e(s 2 )- £7 2 = f —V 2 - £7 2 = 

in) n 


2-Estimateurs Convergents 

• Definition: On appelle estimateur 
Convergent du parametre tftoute 
statistique T=T(X lf X 2 , X n ) telle que: 


T—^e 


• Remarque : La loi des grands nombres 
implique que X est un estimateur 
convergent de fi. De meme que F est un 
E.C. d ep 


Definition: On appelle estimateur 
asymptotiquement sans biais, du 
parametre fttoute statistique 
T=T(X lf X 2 , X n ) telle que: 

lim E(T) = 0 


Exempfe'. 

S e 2 est un estimateur asymptotiquement 
sans biais de a 2 : 

lim£'(5' e 2 )= lim 



Theoreme \ L.G.N. generalisee 

• Si T est un estimateur sans biais ou 
asymptotiquement sans biais de 6, et si 
sa variance tend vers zero lorsque n tend 
vers I'infini, alors T est un estimateur 
convergent de 6 \ 

•Si lim E(T) = 0 et limV(r) = 0 


• Alors rp, P 
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Fxemp/e : 

lim£(s 2 )=<7 2 et limv(s 2 )=0 

Alors 

S 2 est un estimateur convrgent de a 2 

• De meme on montre que J^est un E.C. 
de G 2 


•Question, Mn v(r)? 

Te{E.S.B.} 


Definition. On appelle Quantite d'information de 
Fisher de 0, la quantite I/O): 


i.¥)=e 


Tg L° g f(X>,X 2 , 



Ou I/O ) depend de n et de la loi de X 
mais ne depend pas de I'estimateur T 


3-Estimateurs Efficaces: 

Entre deux estimateurs sans biais. on 
prefere utiliser celui qui a la variance la 
plus petite. 

• Definition: Soient T 1 et T 2 deux 
estimateurs sans biais du meme 
parametre 6 et bases sur le meme 
echantillon. On dit que T 1 est plus precis 
que T 2 si: 

V(7;)<y(r 2 ) 


• Femarques :S6\\f(x,0)\z densite de la loi de X, 

alors ^I9>s'ecrit aussi (sous certaines conditions 

qu'on supposera toujours verifiees): 


i- 

f 

I n {0) = nE 

K 

J J 


2- 

l.(e) = nl l (0) 


3- 

iM=-"E^Lo g f(x.e) j 



Fxemp/e \ Montrons que x est plus precis 

que 

r = x i + X 2 . on a d'abord: 

><l 

II 

2 

E{r) = ju donc X et T sont 

deux E. 

S.B. de ju. 


v(r)/v(x,)Mx 2 ))=/x)f 

Or V(x) = 

a 2 

n 

D'ou 



y(x)<V(r) pour n>2 


4- Le rapport 



est appele 


Borne de CRAMER-RAO 
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• Propriety . Inegalite de CRAMER-RAO 

Si T est un Estimateur sans biais (E.S.B.) du 
parametre e.alors : 


v(t)>b cr (o) 

f? 


III Recherche d'estimateurs 


• Soit (x lA x 2 , x n ) la realisation d'un 
echantillon aleatoire X u X 2 , X n , 
relatif a la V.A. parente X de loi P e . 

La probabilite d'obtenir une telle 
realisation est : 

P e (X t =x v X 2 =xj=n P«(X, = 


• Definition ■. un E.S.B. T de e, est dit 
efficace si sa variance est egale a la 
borne de Cramer-Rao: 

V{T) = B CR {9)_ 

Bst dit 

> 

• Definition: un E.S.B. T de e, < 
asymptotiquement efficace si: 

v( y\-i 

( b cr (g) 


Definition : On appelle Estimateur de 
Maximum de^Vraisemblance ( E.M.V. ) pour 
6, la valeur 6 de d, qui maximise cette 
probabilite. 


En pratique, il revient au meme de 
chercher #qui maximise le logarithme de 
la probabilite, soit : 

L(0) = XL O g[/> 8 (X, =*,)] 


Fxempie : Si X ^ ^T(|o, , a 2 ), alors 

et v(x)= — 

a n 


Or X E.S.B. de [i, d'ou il est efficace de \i. 

2cr 4 


In\c r 2 


= —jet V(S>)=^ 
2cr 4 V ' n - 1 


S 2 est asymptotiquement efficace de a 2 car 
(n/n-1) — *1 


• Pe marque ■. 


• 0 maximise L[0) ssi 1 

• Krempte : 

I0w<» 

• S\X^^ {p)^p p (x. 

= x t )= p x ‘q~ x ‘ 

• D'ou 

L(p) = ± [xfogp + (l - x, )Log (l -p)] 
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3L ■ I x < 

— = 0 <=> /?Vx ( =n<^> p = — = F 

dp tt n 

02^ 

Verifiez ensuite que -(£>)< 0 

de 2 


On conclu que F est bien un E.M.V. pour p 


B- Estimation Par Intervalle de Confiance 

-Definition: On dit que (C V C 2 ) est un 
intervalle de confiance au niveau 1-a pour 
le parametre 0 si on a : 

p((c, ; c 2 ) s e) = p(c t <e<c 2 )=i-a 

-Les bornes Q et C 2 de I'intervalle sont 
des statistiques relatives a I' E.A. 


IV Cas Exhaustif 

1-Cas de la moyenne : 0=ju 

Lorsque le tirage est sans remise, X 
garde la meme esperance mais pas la 
meme variance: 

e(x)=m et v(x)=—X^~ 

n N -1 

Remarque : v(x TSR )<v(x TAR ) 


1-a est appele niveau de confiance de 
I'intervalle ( C lr C 2 ). 

Plus a est petit et plus I'intervalle de 
confiance est grand. Generalement, on 
considere des intervalles a risques 
symetriques: 

p(o >C 2 )= P{d < Cj ) = y 


2-Cas de la variance : 6=g 2 


1- Intervalle de Confiance pour une 
proportion: I c (p) 

>Si le TAR S 2 est un E.S.B. de G 2 


• 1- Construction de L' I c (p): Afin d'estimer une 

>Mais lorsque le TSR, on a: 


proportion p de « Succes » par exemple; on utilise 

N ^2 est done un ESB de G 2 


la frequence F qui est un estimateur sans biais 
convergent et efficace du parametre p. De plus, on 


a (d'apres le T.C.L.) 


• z = o,i) 

]— 

N 


V n 



• des que n > 30 et np > 5 et nq > 5 
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• Propriete: Soit X lr X 2 , X n un 
echantillon aleatoire simple de taille n, 
relatif a la V.A. parente X suivant une loi 
de Bernoulli de parametre p inconnu. Un 
intervalle de confiance au niveau 1-a 
pour p est comme suit : 

\ n \ n 


5 >30 et nf>5 et n(l-f)>5 
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2- Precision d'une estimation par intervalle 
de confiance: Pour un a donne, on veut 
determiner la taille necessaire de I'echantillon pour 
atteindre une certaine precision de I'estimation. 
-Notons a(a,n) I'amplitude de I c (p) : 



• Exercice:Parmi un E.A. de 250 electeurs, 108 
declarent vouloir voter pour le president sortant. 
Tandis que les autres voteront pour I'autre candidat. 
Donner un l c (p) au niveaux 90 et 95% 

• Combien faudrait-il interroger d'electeurs pour que 
I'erreur d'estimation ne depasse pas 2% ? 

• Reponse 

• 1 )- 

1 avec proba. p si vote pour A 
0 avec proba. 1 - p si vote pour B 

I* D'ou : X (p) 


■ On appelle erreur d'estimation la demi- 
longueur de I c 


Cl(a, r 


Or p est inconnu, on utilise done la 
majoration: 


yjp{\-p)<Y 2 



p represente la proportion des votants 
en faveur de A dans toute la population 
des electeurs. 


■ Une estimation ponctuelle de p est 
donnee, grace a la realisation de I'E.A., 
par la frequence: 

«, = 108 2 
n 250 

■ Cond 9 TCL: 


n = 250 > 30 et nf = 108 > 5 et 142>5 


Or a=10%, d'ou z a/2 =z 0 05 =l / 645(loi normale C.R) 


Pour que I'erreur d'estimation soit 
inferieure ou egale a e: 


■ II faut que n soit: 

— — 



Remarque: Plus I'erreur d'estimation est 
petite et plus la precision est grande. 


i c (p)= 


\f-Zal 


7 M 


'J+Zal 




= [0,432-1,645x0,03 1; 0,432+1,645x0,03 1 
= [0,381; 0,483] 


• 2)-oc= 5% z 0 025 = 1,96 

I c (p)= [ 0,371 ; 0,493 ] 
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iJm)= 


G _ 

x ~ ’ x Za/2 

y/n 


G 



Cet intervalle n'a de sens que si a 2 e st 
connue. 

51 a 2 est inconnue, on I'estime alors par 

5 2 et on obtient la V.A. (grace a 
I'hypothese de Normalite) : 





II- Intervalle de Confiance pour la 


• Notre intervalle de confiance devient : 

moyenne: I C (|X,) 




• 1)- I c (jJ.) dans le cas d'un population Normalement 


iM)= 

_ S _ S 

distribute: 

• Dans ce cas la V.A. parente X suit : 

• X , a 2 ). 


X — K-\,al2 ~T = ’ X + K-\ ,a/2 ~T = 

yin yin J 


• Or, on sait que X est un bon estimateur 


■ 0(1 l n-\ 

l a/2 est ' a va ' eur critique d'ordre 

de la moyenne jx : 


all lue dans la table de student a n-1 

• X /-w , C 2 /n). 


d.d.l. 




•Propriete: Soit la V.A X , O 2 ) . 

•1)- Si c 2 est connue, alors un intervalle 
de confiance au niveau 1-a pour |x est : 

G _ G 

X ~ Z a/2 ~j = ’ X + Z a/2 ~1 = 

yin yjn_ 

•2)- Si a 2 est inconnue, alors un intervalle 
de confiance au niveau 1-a pour |i est : 



'cM= 


f • Y 4 - t 

'n-l,a/2 r~ ’ A ^ l n-l,a/2 f 

y/n 


s 

'Tn 
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• 2)- l c (p) dans le cas d'un population 
quelconque: 


La variance de X peut-etre consideree 
comme une mesure de I'incertitude de 
I'actif et done comme une mesure de son 
risque. 

Soit P la population des actions des 
entreprises du secteur micro- 
informatique. X est le taux de rendement 
de ses actions; on suppose : 

X 

On preleve au hasard 30 actions et 
construisons un intervalle de confiance 
pour a 2 


•Propriete: Soit X l7 X 2 ,..., X n un echantillon 
aleatoire relatif a X/x^-LQ (p , a 2 ) . 

1)- Si a 2 est connue. et si n> 30alors un 
intervalle de confiance au niveau 1-a de p 


I c (m) = 


<J _ 

X — Za/2 f— ’ X Za/2 

yin 


<7 



•2)- Si a 2 est inconnue. et si n> 
notre intervalle pour p devient : 
r 


x ~z a ,i mmi x + z n 


i c (m)= 


' -Jn 


s 

7 ln_ 


Si \x est inconnue. on utilise alors S 2 et on 
obtient la V.A. (grace a I'hypothese de 



III- Intervalle de Confiance pour la 
variance: l c (c 2 ) 

• Pour montrer le grand interet que 
presente la variance, on prend I'exemple 
ou X est le taux de rendement d'un actif 
financier. Celui-ci est definit comme suit: 

R _ P l +dt-P t _ l 

' P t - 1 

• Ou P t est le prix de la periode t, et dt le 
dividende de la meme periode 
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IV- Intervalle de Confiance pour la 
difference des moyenne 

• 1)- IcfjJ-! - \l 2 ) dans le cas de 2 populations 
Normalement distributes: 


•Soient P 2 et P 2 2 populations que Ton 
etudie selon la V.A. parente X de loi sur P 2 

N (Hi » <*i 2 ) et W(|Ll 2 , a 2 2 ) sur P 2 . 

•On veut estimer la difference des 
moyennes (ij - (i 2 ■ 


1 Si les deux variances Oj 2 et o 2 2 sont connues : 


4(m-a)= 


°1 °2 

X l -X 2 ~Z c ,nJ—+—, 




- - °1 °2 
^-^2+^/2,—+— 
IK «2 


• Si les variances sont inconnues mais 
egales 


• Pour cela, on preleve 2 echantillons 
independamment de tallies n 1 et n 2 
respectivement de P 2 et P 2 

• Et on definie alors 2 estimateursXjet X 2 
respectivement de et p, 2 

On propose alors X x -X 2 estimateur 
de m - |i 2 : 

/i jh& =£(x,-X 2 )=£(x 1 )-£(x 2 ) 
= A~A 2 


On les estime alors par l S 2 , ou 

^ 2 _ (»,-iK 2 +(» 2 -i).s 2 2 

(n,-l)+(n 2 -l) 

• Et done on construit une V.A. de Student: 
r = (Xi-x )-(//i-// 2 ) ^ t (n + n 2 -2) 
\n x n 2 


•D'ou notre intervalle de confiance au 
niveau l-a : 

/ c (a-a)= 

Jl 1 

L K 

>!l 

1 

+ 

s 

Jl l 

-2;a/2 S J + 

IK 


•Ou est lu dans la table de student a n 1 +n 2 -2 
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2)- le cas de 2 populations quelconques: 


a)- Si les deux variances o x 2 et o 2 2 sont connues 


•On considere alors la V.A. pour n x ,n 2 >30 
z = (*i~*2 )~(a-A 2 ) „ 5V( 0 i) 
y n 2 



• Done, notre intervalle de confiance au niv. 
1-a, de la difference des moyennes s'ecrit : 

f c (a-a)= 

- - °1 °2 
^-^ 2 -^/ 2 ,—+—; 

V ^ «2 

\ —■ *2 +Z a/2- 

in «2_ 



V- Intervalle de Confiance pour la 
difference des proportions 

•Soient P x et P 2 2 populations que Ton 
etudie selon la V.A. parente X suivant la loi 

£&(/?,) sur P 1 et £B(/^) sur P 2 . 

•On veut estimer la difference des 
proportions/^-/^. Alors des que: 

n, > 30 , n i f i >5,n i (l-f i )>5:i = l,2 


• Si les variances sont inconnues: 

_2 

• On estime chaque CF- par Sj 2 et on 
considere alors la V.A. pour n x ,n 2 >50 

Z _ ~ ^2 )~ (Ml ~ Pi ) ^(0,1) 

.JW 

\ n r n 2 

• Done, notre intervalle de confiance au niv. 
1-a, s'ecrit : 


• notre intervalle de confiance s'ecrit au 
niveau l- a : 

I c(Pi-P2) = 

f\ ~fl +Z a/2, 

i P «2 

l/i(l-/i) , / 2 (l-/ 2 ) 

V A «2 J 
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VI- Intervalle de Confiance pour le 
Rapport des variances 
•Les deux populations sont supposees etre 
Normalement distributes: 

•Sur P 1 : X /v*- °f) 

•Sur P 2 : X <y^(/U 2 , < 5 2 ) 

•On s'interesse a I'estimation du rapport 

of/ 

/ 


D'ou notre intervalle de confiance pour le rapport 
de variance au niveau 1 -a : 




_2 

\ a 2 J 


s 2 

2 l p 

s 2 1 - 

\^2 


all ; n 2 -l,n l -l ’ 



\ 

;n 2 -l,n! -1 

J 



Remarque : Pour des raisons de 
lecture des tables statistiques de 
Fisher, on choisi d'estimer le 
rapport ( o 1 2 / g 2 2 ) si (s 1 2 >s 2 2 ); 
sinon on doit estimer le rapport 
(C- 2 2 M 2 ). 
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